导演:陈仲铭
本书构建了一个完整的深度强化学习理论和实践体系:从马尔科夫决策过程开始,根据价值函数、策略函数求解贝尔曼方程,到利用深度学习模拟价值网络和策略网络。书中详细介绍了深度强化学习相关最新算法,如Rainbow、APE-X算法等,并阐述了相关算法的具体实现方式和代表性应用(如AlphaGo)。此外,本书还深度剖析了强化学习各算法之间的联系,有助于读者举一反三。 本书分为4个部分:初探强化学习、求解强化学习、求解强化学习进阶和深度强化学习。涉及基础理论到深度强化学习算法框架的各方面内容,反映了深度强化学习领域过去的发展历程和最新的研究进展,有助于读者发现该领域中新的研究问题和方向。 本书适用于计算机视觉、计算机自然语言的相关从业人员,以及对人工智能、机器学习和深度学习感兴趣的人员,还可作为高等院校计算机等相关专业本科生及研究生的参考用书。